HLL: ¿Pueden los agentes superar la última barrera de verificación humana?
¿Son los agentes multimodales capaces de pasar la última línea de verificación? El nuevo benchmark HLL expone sus limitaciones frente a CAPTCHAs interactivos.
¿Son los agentes multimodales capaces de pasar la última línea de verificación? El nuevo benchmark HLL expone sus limitaciones frente a CAPTCHAs interactivos.